表格内容识别（python-opencv）（一）【9/8】

最新推荐文章于 2024-03-11 06:13:56 发布

VIP文章 real_xxxmy

最新推荐文章于 2024-03-11 06:13:56 发布

阅读量1.3w

点赞数 8

分类专栏： opencv 文章标签：表格识别 opencv python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/huangwumanyan/article/details/82526873

版权

暑假都在弄这个，一开始以为是要弄一个通用的对表格进行分块和把内容全部识别，所以又分块又分行又把横线上的内容单独弄出来，后来说是对于已知的特定表格，所以最后都用python来写了，比较方便。在网上只找到一个比较巧妙的提取表格框架的方法，用横向和竖向的细长的条去腐蚀膨胀可以得到横线和竖线，拼在一起就是完整的表格框架，而且这样正好把一些小点和文字去除了。

这样的话因为有些线太细，就检测所有轮廓再加粗一次，上图为加粗后的表格框架和找到的表格块（这图有点问题。。。好的找不到了）。但这个方法有个问题就是表格位置必须比较正，如果倾斜角度较大则不行。所以要先对表格进行透视变换后摆正。这里使用的方法是用上图找到的表格框架，找到表格的四个顶点，再和其轮廓的外接矩形的四个顶点得到变换矩阵。这里还有个问题，就四个顶点和变换后的四个顶点必须是对应的，所以要对四个顶点进行排序，怎么对矩形的四个顶点进行排序，在网上也找到了一个比较好的方法，就是将得到的四个顶点先按照y坐标分成上下A、B两部分，再对A部分按x坐标从小到大排序，对B部分按x坐标降序排序，这样四个点就能按照顺时针排列了，对于没有定位标识的表格，只要表格不是倒着摆放或者过分倾斜都可以正确变换。然后还有一个问题就是这是用外接矩形作为变换后

最低0.47元/天解锁文章

关注

8
点赞
踩
60

收藏

觉得还不错? 一键收藏
14
评论
表格内容识别（python-opencv）（一）【9/8】

暑假都在弄这个，一开始以为是要弄一个通用的对表格进行分块和把内容全部识别，所以又分块又分行又把横线上的内容单独弄出来，后来说是对于已知的特定表格，所以最后都用python来写了，比较方便。在网上只找到一个比较巧妙的提取表格框架的方法，用横向和竖向的细长的条去腐蚀膨胀可以得到横线和竖线，拼在一起就是完整的表格框架，而且这样正好把一些小点和文字去除了。这样的话因为有些线太细，就检测所有轮...
复制链接

扫一扫

专栏目录

评论 14

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。